Data Understanding#
Data Unserstanding merupakan suatu proses mengumpulkan, mengeksplorasi, dan mengevaluasi suatu data yang bertujuan untuk memastikan data sesuai dengan tujuan bisnis dan telah siap menuju proses analisis. Tahapan dalam memahami data terdiri dari:
Pengumpulan data: Mengidentifikasi dan mengumpulkan data dari berbagai sumber yang relevan.
Deskripsi Data: Memahami struktur dari data, yakni jumlah baris, kolom, dan jenis dari suatu variabel atau atribut.
Eksplorasi Data: Merupakan suatu proses mencari pola dari data, korelasi, dan anomali menggunakan cara statistik deskriptif melalui visualisasi data.
Kualitas Data: Bagaimana memeriksa kelengkapan, tingkat akurasi, konsistensi dari suatu data.
Membuat Database Postgre#
Proses pembuatan database Postgre menggunakan database cloud aiven.io dan dbeaver sebagai tempat untuk menyimpan suatu datanya. Awalnya kita membuat suatu project dalam aiven dengan memilih database postgre sebagai sumbernya, kemudian mengkoneksikan aiven ke dbeaver melalui kredensial yang dimiliki project aiven. Selanjutnya, membuat database pada service dan mengimport data dalam bentuk csv.
Langkah-Langkah membuat Service Postgre dalam aiven.io#
Berikut merupakan langkkah-langkah dalam membuat service dalam aiven.io:
Kunjungi laman situs aiven.io melalui link https://aiven.io/
Silahkan login terlebih dahulu jika belum memiliki akun aiven
Buat Project terlebih dahulu sebelum membuat servicenya.
Klik “Create Service” dan pilih databse Postgre sebagai databasenya.
Kemudian klik tipe plan yang “Free Plan” dan pilih “Create Service”.
Kemudian terdapat informasi terkait dengan informasi service, cara koneksi, dan informasi kredensial dari service.
Berikut informasi dari kredensial service.
Langkah-Langkah Membuat Database Postgre dan Insert Data di Dbeaver#
Install Dbeaver melalui sites resmi https://dbeaver.io/download/.
Buat Database baru dengan source Postgre pada Dbeaver.
Koneksikan Database dengan cloud Database aiven melalui kredensial service Postgre yang disediakan aiven.io.
Ketika koneksi database telah berhasil, buat schema baru dengan cara klik kanan dan pilih opsi “Create New Schema”.
Kemudian Import Data yang akan dimasukkan ke dalam schema terbaru dengan cara klik kanan pada Schema, pilih opsi Import Data.
Pilih data yang akan diimport, biasanya menggunakan format CSV. Setelah itu ikuti prosedur untuk mengimport data.
Berikut merupakanhasil dari import data.
Mengimport Data Postgre ke Power BI#
Langkah-Langkah Mengimport Data#
Siapkan tools Power BI yang telah teristall melalui site resmi yakni melalui Microsoft
Setelah itu buat blank baru atau project baru.
Pilih Fitur Get Data pada Navbar Power BI.
Pada menu “ALL” atau “Database” pilih PostgreSQL Database, setelah itu klik “Connect”.
Kemudian isi form server dan database sesuai dengan kredensial yang dimiliki oleh service postgre aiven.
Apabila terjadi eror install terlebih dahulu CA Certivicate aiven dan pasang di Local Machine
Berikut Data yang berhasil di import atau ditarik melalui aiven.
Membuat Database Mysql#
Proses pembuatan database Mysql menggunakan database cloud aiven.io dan dbeaver sebagai tempat untuk menyimpan suatu datanya. Awalnya kita membuat suatu project dalam aiven dengan memilih database Mysql sebagai sumbernya, kemudian mengkoneksikan aiven ke dbeaver melalui kredensial yang dimiliki project aiven. Selanjutnya, membuat database pada service dan mengimport data dalam bentuk csv.
Langkah-Langkah Membuat Service MySQL dalam aiven.io#
Berikut merupakan langkkah-langkah dalam membuat service dalam aiven.io:
Kunjungi laman situs aiven.io melalui link https://aiven.io/
Silahkan login terlebih dahulu jika belum memiliki akun aiven
Buat Project terlebih dahulu sebelum membuat servicenya.
Klik “Create Service” dan pilih databse Mysql sebagai databasenya.
Kemudian klik tipe plan yang “Free Plan” dan pilih “Create Service”.
Kemudian terdapat informasi terkait dengan informasi service, cara koneksi, dan informasi kredensial dari service.
Berikut informasi dari kredensial service.
Langkah-Langkah Membuat Database Mysql dan Insert Data di Dbeaver#
Install Dbeaver melalui sites resmi https://dbeaver.io/download/.
Buat Database baru dengan source Mysql pada Dbeaver.
Koneksikan Database dengan cloud Database aiven melalui kredensial service Mysql yang disediakan aiven.io.
Ketika koneksi database telah berhasil, buat database baru dengan cara klik kanan dan pilih opsi “Create New Database”.
Kemudian Import Data yang akan dimasukkan ke dalam database terbaru dengan cara klik kanan pada database, pilih opsi Import Data.
Pilih data yang akan diimport, biasanya menggunakan format CSV. Setelah itu ikuti prosedur untuk mengimport data.
Mengimport Data Mysql ke Power BI#
Langkah-Langkah Mengimport Data#
Siapkan tools Power BI yang telah teristall melalui site resmi yakni melalui Microsoft
Setelah itu buat blank baru atau project baru.
Pilih Fitur Get Data pada Navbar Power BI.
Pada menu “ALL” atau “Database” pilih MySQL Database, setelah itu klik “Connect”.
Kemudian isi form server dan database sesuai dengan kredensial yang dimiliki oleh service Mysql aiven.
Apabila terjadi eror install terlebih dahulu CA Certivicate aiven dan pasang di Local Machine
Berikut Data yang berhasil di import atau ditarik melalui aiven.
Mendeskripsikan Tipe Data#
Data yang telah diimport pada Power BI:
Berdasarkan Tabel tersebut bahwa fitur Sepal Length, Sepal Width, Petal Length, Petal Width merupakan distribusi data dengan tipe data yang sama yakni Numerik. Data numerik adalah data berupa angka yang dapat dihitung secara matematis (misalnya dijumlah, dirata-rata, dicari maksimum/minimum, dll).
Sedangkan Fitur Iris memiliki tipe data berupa Kategorikal yang ditujukkan berupa teks pada datanya. Data kategorikal adalah data yang nilainya berupa label, simbol, atau kategori yang digunakan untuk mengelompokkan objek, bukan untuk operasi matematis (seperti penjumlahan atau rata-rata).
Eksplorasi Data#
Mencari nilai Min-Max setiap Kolom#
Langkah-Langkah Mencari Nilai Min Max#
Pada Sidebar VIsualization, pilih table visual.
Kemudian pilih kolom yang akan dicari untuk nilai max atau min nya.
Klik kembali disamping kiri kolom yang dipilih, maka akan muncul pada Navbar fitur Summarization dan pilih opsi untuk mencari nilai min atau max nya.
Maka akan langsung muncul untuk nilai min atau max pada suatu kolom.
Nilai Max dari Setiap Kolom#
Berdasarkan tabel di atas di dapat nilai maximum setip fitur atau kolom pada data iris yakni:
Sepal Length: 7.90
Sepal Width: 4.40
Petal Length: 6.90
Petal Width: 2.50
Nilai Minimun Setiap Kolom#
Berdasarkan tabel di atas di dapat nilai minimum setip fitur atau kolom pada data iris yakni:
Sepal Length: 4.30
Sepal Width: 2.00
Petal Length: 1.00
Petal Width: 0.10
Mencari Rata-Rata dari Setiap Kolom#
Langkah-Langkah Mencari Nilai Rata-Rata Setiap Kolom#
Pada Sidebar VIsualization, pilih table visual.
Kemudian pilih kolom yang akan dicari untuk nilai rata-rata nya.
Klik kembali disamping kiri kolom yang dipilih, maka akan muncul pada Navbar fitur Summarization dan pilih opsi untuk mencari nilai rata-rata atau average nya.
Maka akan langsung muncul untuk nilai rata-rata pada suatu kolom.
Nilai Rata-Rata Setiap Kolom#
Berdasarkan tabel di atas di dapat nilai rata-rata setip fitur atau kolom pada data iris yakni:
Sepal Length: 5.84
Sepal Width: 3.05
Petal Length: 3.76
Petal Width: 1.20
Jumlah Distribusi Data Setiap Kelas Menggunakan Visualisasi Grafik#
Langkah-Langkah Membuat Grafik Untuk Visualisasi Jumlah Data#
Pada Sidebar Visualization, pilih Stacked Column Chart.
Kemudian pilih kolom yang akan distribusi jumlah datanya.
Klik kembali disamping kiri kolom yang dipilih, maka akan muncul pada Navbar fitur Summarization dan pilih opsi untuk mencari jumlah data yakni count.
Kemudian Drop data pada X-axis dan Y-axis di sidebar visualization.
Tampilan Visualisasi Grafik#
Berdasarkan grafik visualisasi di atas jumlah distribusi data pada setiap kelas yakni rata, masing- masing kelas memiliki jumlah data sebanyak 50.